home *** CD-ROM | disk | FTP | other *** search
/ PC World 2006 February / PCWorld_2006-02_cd.bin / software / vyzkuste / triky / triky.exe / httrack-3.33.exe / {app} / src / htsjava.c < prev    next >
C/C++ Source or Header  |  2004-05-09  |  10KB  |  409 lines

  1. /* ------------------------------------------------------------ */
  2. /*
  3. HTTrack Website Copier, Offline Browser for Windows and Unix
  4. Copyright (C) Xavier Roche and other contributors
  5.  
  6. This program is free software; you can redistribute it and/or
  7. modify it under the terms of the GNU General Public License
  8. as published by the Free Software Foundation; either version 2
  9. of the License, or any later version.
  10.  
  11. This program is distributed in the hope that it will be useful,
  12. but WITHOUT ANY WARRANTY; without even the implied warranty of
  13. MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
  14. GNU General Public License for more details.
  15.  
  16. You should have received a copy of the GNU General Public License
  17. along with this program; if not, write to the Free Software
  18. Foundation, Inc., 59 Temple Place - Suite 330, Boston, MA  02111-1307, USA.
  19.  
  20.  
  21. Important notes:
  22.  
  23. - We hereby ask people using this source NOT to use it in purpose of grabbing
  24. emails addresses, or collecting any other private information on persons.
  25. This would disgrace our work, and spoil the many hours we spent on it.
  26.  
  27.  
  28. Please visit our Website: http://www.httrack.com
  29. */
  30.  
  31.  
  32. /* ------------------------------------------------------------ */
  33. /* File: Java classes parser                                    */
  34. /* Author: Yann Philippot                                       */
  35. /* ------------------------------------------------------------ */
  36.  
  37.  
  38. /* Internal engine bytecode */
  39. #define HTS_INTERNAL_BYTECODE
  40.  
  41. /* Version: Oct/2000 */
  42. /* Fixed: problems with class structure (10/2000) */
  43.  
  44. // htsjava.c - Parseur de classes java
  45.  
  46. #include "stdio.h"
  47. #include "htsglobal.h"
  48. #include "htscore.h"
  49.  
  50. #include "htsjava.h"
  51.  
  52. #include "htsnostatic.h"
  53.  
  54. //#include <math.h>
  55.  
  56. static int reverse_endian(void) {
  57.     int endian = 1;
  58.     return ( * ( (char*) &endian) == 1);
  59. }
  60.  
  61. /* big/little endian swap */
  62. #define hts_swap16(A) ( (((A) & 0xFF)<<8) | (((A) & 0xFF00)>>8) )
  63. #define hts_swap32(A) ( (( (hts_swap16(A)) & 0xFFFF)<<16) | (( (hts_swap16(A>>16)) & 0xFFFF)) )
  64.  
  65.  
  66. // ** HTS_xx sinon pas pris par VC++
  67. #define HTS_CLASS  7
  68. #define HTS_FIELDREF  9
  69. #define HTS_METHODREF  10
  70. #define HTS_STRING  8
  71. #define HTS_INTEGER  3
  72. #define HTS_FLOAT  4
  73. #define HTS_LONG  5
  74. #define HTS_DOUBLE  6
  75. #define HTS_INTERFACE  11
  76. #define HTS_NAMEANDTYPE  12
  77. #define HTS_ASCIZ  1
  78. #define HTS_UNICODE  2
  79.  
  80. #define JAVADEBUG 0
  81.  
  82. int hts_detect_java(htsmoduleStruct* str) {
  83.   char* savename = str->filename;
  84.   if (savename) {
  85.     int len = (int) strlen(savename);
  86.     if (len > 6 && strfield(savename + len - 6,".class")) {
  87.       return 1;
  88.     }
  89.   }
  90.   return 0;
  91. }
  92.  
  93. int hts_parse_java(htsmoduleStruct* str)
  94. {
  95.   FILE *fpout;
  96.   JAVA_HEADER header;
  97.   RESP_STRUCT *tab;
  98.   char* file = str->filename;
  99.   
  100.   str->relativeToHtmlLink = 1;
  101.  
  102. #if JAVADEBUG
  103.   printf("fopen\n");
  104. #endif
  105.   if ((fpout = fopen(fconv(file), "r+b")) == NULL)
  106.   {
  107.     //fprintf(stderr, "Cannot open input file.\n");
  108.     sprintf(str->err_msg,"Unable to open file %s",file);
  109.     return 0;   // une erreur..
  110.   }
  111.     
  112. #if JAVADEBUG
  113.   printf("fread\n");
  114. #endif
  115.   //if (fread(&header,1,sizeof(JAVA_HEADER),fpout) != sizeof(JAVA_HEADER)) {   // pas complet..
  116.   if (fread(&header,1,10,fpout) != 10) {   // pas complet..
  117.     fclose(fpout);
  118.     sprintf(str->err_msg,"File header too small (file len = "LLintP")",(LLint)fsize(file));
  119.     return 0;
  120.   }
  121.  
  122. #if JAVADEBUG
  123.   printf("header\n");
  124. #endif
  125.   // tester en tΩte
  126.   if (reverse_endian()) {
  127.     header.magic = hts_swap32(header.magic);
  128.     header.count = hts_swap16(header.count); 
  129.   }
  130.   if(header.magic!=0xCAFEBABE) {
  131.     sprintf(str->err_msg,"non java file");
  132.     if (fpout) { fclose(fpout); fpout=NULL; }
  133.     return 0;
  134.   }
  135.  
  136.   tab =(RESP_STRUCT*)calloct(header.count,sizeof(RESP_STRUCT));
  137.   if (!tab) {
  138.     sprintf(str->err_msg,"Unable to alloc %d bytes",(int)sizeof(RESP_STRUCT));
  139.     if (fpout) { fclose(fpout); fpout=NULL; }
  140.     return 0;    // erreur..
  141.   }
  142.  
  143. #if JAVADEBUG
  144.   printf("calchead\n");
  145. #endif
  146.   {
  147.     int i;
  148.     
  149.     for (i = 1; i < header.count; i++) {
  150.       int err=0;  // ++    
  151.       tab[i]=readtable(str,fpout,tab[i],&err);
  152.       if (!err) {
  153.         if ((tab[i].type == HTS_LONG) ||(tab[i].type == HTS_DOUBLE)) i++;  //2 element si double ou float
  154.       } else {    // ++ une erreur est survenue!
  155.         if (strnotempty(str->err_msg)==0)
  156.           strcpybuff(str->err_msg,"Internal readtable error");
  157.         freet(tab);
  158.         if (fpout) { fclose(fpout); fpout=NULL; }
  159.         return 0;
  160.       }
  161.     }
  162.     
  163.   }
  164.  
  165.   
  166. #if JAVADEBUG
  167.   printf("addfiles\n");
  168. #endif
  169.   {
  170.     unsigned int acess;
  171.     unsigned int Class;
  172.     unsigned int SClass;
  173.     int i;
  174.     acess = readshort(fpout);
  175.     Class = readshort(fpout);
  176.     SClass = readshort(fpout);
  177.     
  178.     for (i = 1; i <header.count; i++) {
  179.       
  180.       if (tab[i].type == HTS_CLASS) {
  181.         
  182.         if ((tab[i].index1<header.count) && (tab[i].index1>=0)) {
  183.           
  184.           
  185.           if((tab[i].index1!=SClass) && (tab[i].index1!=Class) && (tab[tab[i].index1].name[0]!='[')) {
  186.             
  187.             if(!strstr(tab[tab[i].index1].name,"java/")) {
  188.               char BIGSTK tempo[1024];
  189.               tempo[0]='\0';
  190.               
  191.               sprintf(tempo,"%s.class",tab[tab[i].index1].name);
  192. #if JAVADEBUG
  193.               printf("add %s\n",tempo);
  194. #endif
  195.               if (tab[tab[i].index1].file_position >= 0)
  196.                 str->addLink(str,tempo);  /* tab[tab[i].index1].file_position */
  197.             }
  198.             
  199.           }
  200.         } else { 
  201.           i=header.count;  // exit 
  202.         }
  203.       }
  204.       
  205.     }
  206.   }
  207.   
  208.  
  209. #if JAVADEBUG
  210.   printf("end\n");
  211. #endif
  212.   freet(tab);
  213.   if (fpout) { fclose(fpout); fpout=NULL; }
  214.   return 1;
  215. }
  216.  
  217.  
  218.  
  219.  
  220. // error: !=0 si erreur fatale
  221. RESP_STRUCT readtable(htsmoduleStruct* str, 
  222.                       FILE *fp, RESP_STRUCT trans, int* error)
  223. {
  224.   unsigned short int length;
  225.   int j;
  226.   *error = 0;  // pas d'erreur
  227.   trans.file_position=-1;
  228.   trans.type = (int)(unsigned char)fgetc(fp);
  229.   switch (trans.type) {
  230.   case HTS_CLASS:
  231.     strcpybuff(trans.name,"Class");
  232.     trans.index1 = readshort(fp);
  233.     break;
  234.     
  235.   case HTS_FIELDREF:
  236.     strcpybuff(trans.name,"Field Reference");
  237.     trans.index1 = readshort(fp);
  238.     readshort(fp);
  239.     break;
  240.     
  241.   case HTS_METHODREF:
  242.     strcpybuff(trans.name,"Method Reference");
  243.     trans.index1 = readshort(fp);
  244.     readshort(fp);
  245.     break;
  246.     
  247.   case HTS_INTERFACE:
  248.     strcpybuff(trans.name,"Interface Method Reference");
  249.     trans.index1 =readshort(fp);
  250.     readshort(fp);
  251.     break;
  252.   case HTS_NAMEANDTYPE:
  253.     strcpybuff(trans.name,"Name and Type");
  254.     trans.index1 = readshort(fp);
  255.     readshort(fp);
  256.     break;
  257.     
  258.   case HTS_STRING:                // CONSTANT_String
  259.     strcpybuff(trans.name,"String");
  260.     trans.index1 = readshort(fp);
  261.     break;
  262.     
  263.   case HTS_INTEGER:
  264.     strcpybuff(trans.name,"Integer");
  265.     for(j=0;j<4;j++) fgetc(fp);
  266.     break;
  267.     
  268.   case HTS_FLOAT:
  269.     strcpybuff(trans.name,"Float");
  270.     for(j=0;j<4;j++) fgetc(fp);
  271.     break;
  272.     
  273.   case HTS_LONG:
  274.     strcpybuff(trans.name,"Long");
  275.     for(j=0;j<8;j++) fgetc(fp);
  276.     break;
  277.   case HTS_DOUBLE:
  278.     strcpybuff(trans.name,"Double");
  279.     for(j=0;j<8;j++) fgetc(fp);
  280.     break;
  281.     
  282.   case HTS_ASCIZ:
  283.   case HTS_UNICODE:
  284.     
  285.     if (trans.type == HTS_ASCIZ)
  286.       strcpybuff(trans.name,"HTS_ASCIZ");
  287.     else
  288.       strcpybuff(trans.name,"HTS_UNICODE");
  289.     
  290.     {
  291.       char BIGSTK buffer[1024]; 
  292.       char *p;
  293.       
  294.       p=&buffer[0];
  295.  
  296.       //fflush(fp); 
  297.       trans.file_position=ftell(fp);
  298.       length = readshort(fp);
  299.       if (length<HTS_URLMAXSIZE) {
  300.         // while ((length > 0) && (length<500)) {
  301.         while (length > 0) {
  302.           *p++ =fgetc(fp);
  303.           
  304.           length--;
  305.         }
  306.         *p='\0';
  307.         
  308.         //#if JDEBUG
  309.         //      if(tris(buffer)==1) printf("%s\n ",buffer);
  310.         //      if(tris(buffer)==2)  printf("%s\n ",printname(buffer));
  311.         //#endif
  312.         if(tris(buffer)==1)  str->addLink(str, buffer);       /* trans.file_position */
  313.         else if(tris(buffer)==2)  str->addLink(str, printname(buffer));
  314.  
  315.         strcpybuff(trans.name,buffer);
  316.       } else {    // gros pb
  317.         while ( (length > 0) && (!feof(fp))) {
  318.           fgetc(fp);
  319.           length--;
  320.         }
  321.         if (!feof(fp)) {
  322.           trans.type=-1;
  323.         } else {
  324.           sprintf(str->err_msg,"Internal stucture error (ASCII)");
  325.           *error = 1;
  326.         }
  327.         return(trans);
  328.       }
  329.     }
  330.     break;
  331.   default:
  332.     // printf("Type inconnue\n");
  333.     // on arrΩte tout 
  334.     sprintf(str->err_msg,"Internal structure unknown (type %d)",trans.type);
  335.     *error = 1;
  336.     return(trans);
  337.     break;
  338.   }  
  339.   return(trans);
  340. }
  341.  
  342.  
  343. unsigned short int readshort(FILE *fp)
  344. {
  345.   unsigned short int valint;
  346.   fread(&valint,sizeof(valint),1,fp);
  347.  
  348.   if (reverse_endian())
  349.     return hts_swap16(valint);
  350.   else
  351.     return valint;
  352.   
  353. }
  354.  
  355. int tris(char * buffer)
  356. {
  357.   //
  358.   // Java
  359.   if((buffer[0]=='[') && buffer[1]=='L' && (!strstr(buffer,"java/")) ) 
  360.     return 2;
  361.   if (strstr(buffer,".gif") || strstr(buffer,".jpg") || strstr(buffer,".jpeg") || strstr(buffer,".au") ) 
  362.     return 1;
  363.   // Ajouts R.X: test type
  364.   // Autres fichiers
  365.   {
  366.     char type[256];
  367.     type[0]='\0';
  368.     get_httptype(type,buffer,0);
  369.     if (strnotempty(type))     // type reconnu!
  370.       return 1;
  371.     // ajout RX 05/2001
  372.     else if (is_dyntype(get_ext(buffer)))   // asp,cgi...
  373.       return 1;
  374.   }
  375.   return 0;
  376. }
  377.  
  378.  
  379. char * printname(char  name[1024])
  380. {
  381.   char* rname;
  382.   //char *rname;
  383.   char *p;
  384.   char *p1;
  385.   int j;
  386.   NOSTATIC_RESERVE(rname, char, 1024);
  387.   rname[0]='\0';
  388.   //
  389.  
  390.   p=&name[0];
  391.   
  392.   if(*p!='[')  return "";
  393.   p+=2;
  394.   //rname=(char*)calloct(strlen(name)+8,sizeof(char));
  395.   p1=rname;
  396.   for (j = 0; j < (int) strlen(name); j++,p++) {
  397.     if (*p == '/') *p1='.'; 
  398.     if (*p==';'){*p1='\0';
  399.     strcatbuff(rname,".class");
  400.     return (rname);}
  401.     else *p1=*p;
  402.     p1++;
  403.   }
  404.   p1-=3;
  405.   *p1='\0';
  406.   return (rname);
  407.   
  408. }
  409.